“基因编辑婴儿”惹争议,你或许不知道机器学习在脱靶效应中的作用?
作者|琥珀
出品| AI科技大本营
又一次,计算机科学家和生物学者站在一起,对抗人类向内探索的挑战——用机器学习预测基因编辑 CRISPR 中的脱靶效应。
今年年初,发表在《自然》生物工程杂志上的一篇论文描述了 Elevation 这项工具。该工具由微软研究员 Nicolo Fusi、加州大学伯克利分校的 Jennifer Listgarten 和 Broad 研究所副主任 John Doench 合作研发,可在 CRISPR 编辑基因时预测脱靶效应。
那么何为“脱靶”?何为“CRISPR”?何为“基因编辑技术”?
首先,让我们来认识这项关键技术“CRISPR”(Clustered regularly interspaced short palindormic repeats),也被称为“CRISPR/Cas9 基因编辑技术”。
根据维基百科上的介绍来看,CRISPR 是存在于细菌中的一种基因组,该基因组中含有曾经攻击过该细菌的病毒的基因片段。细菌透过这些基因片段来侦测并抵抗相同病毒的攻击,并摧毁其 DNA 的特定部分。目前 Cas9 是首个被掌握且广泛应用的核酸酶。
该系统主要由两部分构成:一个负责剪切的 Cas9 蛋白,一个负责识别基因组中特定序列的“向导RNA”(sgRNA)。
通过该序列,科学家们可以准确且有效地编辑生命体内的部分基因(通俗来讲,就是在特定基因的特定位点切割和改变 DNA)。该技术可能会带来突破性应用,如改造细胞生产高产耐寒作物,甚至还可能帮助人类大规模消除癌症、艾滋等疾病。
机器学习预测脱靶效应
不知大家是够还记得 2017 年 5 月发表在《Nature Methods》杂志上的一篇题为“Unexpected mutations after CRISPR-Cas9 editing in vivo”的论文研究?尽管后续调查发现研究存在的实验漏洞导致了错误判断,但也侧面反映出 CRISPR/Cas9 基因编辑系统存在的技术安全上诸多挑战。
其中一个重要问题就是发生在基因组中的脱靶效应,不仅在其目标序列切割,还对相似序列进行切割,导致产生潜在突变及危害。这一现象被称为“脱靶效应”。
为此,研究人员现在有多种方法来改善这一问题。本文开头提到的 Elevation 工具正是试图通过机器学习手段予以预测。
首先,他们在生成的数据上训练出了第一层机器学习模型。这些数据报告了所有可能的靶向区域的活动,只有一个核苷酸与向导 RNA 不匹配。
然后,通过团队哈佛医学院和马塞诸塞州总医院附属医院给出的公开数据,机器学习专家训练了第二层模型,该模型将第一层模型改进并推广到模型存在多个错配核苷酸的案例中。
"第二个模型非常重要,因为脱靶效应可以发生在不止一次向导 RNA 与靶向 DNA 之间的错配",伯克利大学分校 Lisgarten 教授表示。在他看来,一些模型特征是直观的,例如向导 RNA 与核苷酸序列之间的错配问题。
最后,该团队在其他几个公开数据集上验证了他们的双层模型,这其中还包括哈佛医学院和马塞诸塞州总医院附属医院生成的数据集。
通过计算工具,研究人员可以输入他们想要修改的基因名称,搜索结果将反馈出预测的脱靶效应,研究人员据此再进行排序。研究人员面临的首要挑战是为特定的实验选择何种 RNA。在每个向导 RNA 上大约有 20 个核苷酸,因此在每组实验中,每个靶向 DNA 基因上都匹配有数百种潜在的向导 RNA。
目前 Elevation 和另一篇用于预测靶向效应的工具 Azimuth 合起来使用,现已开源代码。(链接:https://www.crispr.ml/)
一场始料未及的风波
实际上,“脱靶效应”这个早就让研究人员们“草木皆兵”的研究话题自始至终都没有妥善的解决方案,而今却因另一件尚未确认的“突破性”进展骤然掀起了世界范围内包括学术研究者在内的热议。
挑起人们兴趣的来源于 11 月 26 日的一则公开消息。
“一对基因经过修改的双胞胎婴儿已于 11 月健康诞生,基因编辑使她们将来可能具有天眼抵抗艾滋病的能力。这是世界首例免疫艾滋病的基因编辑婴儿,也意味着中国在基因编辑技术用于疾病预防领域实现历史性突破。”
来自中国深圳的科学家贺建奎在第二届国际人类基因组编辑峰会召开前一天表示。
图:贺建奎
然而,这个“历史性突破”却未迎来掌声,而是更多人对该起事件的谴责。就连该技术发明人 Jennifer Doudna 也紧急回应称:“假定今天( 26 日)的新闻得到证实,这使得对基因编辑技术的使用限制更为紧迫,我们应该限制对人类胚胎细胞的基因编辑仅仅用于确切的未被满足的医学需求。”
基因编辑技术,无论是用在人类医学、动植物育种还是药物筛选领域,都存在技术与伦理道德层面的双重考验。
那么如果在可接受的伦理道德和医学需求范围之内,研究人员对基因编辑技术的探索仍旧不会终止。
这不禁让笔者想起了“进击的巨人”中描述的那样:破墙而入捕食人类的巨人,实际上在数百年前是人类自己所创造。
目前贺建奎团队表示将于11 月 28 日(本周三)在香港正式发布关于此次基因编辑的全盘报告,让我们拭目以待。
◆
精彩推荐
◆
CSDN 学院出品的《人工智能工程师直通车》实训营,目的是:通过 120 天的实战,将学员培养达到具备一年项目经验的人工智能工程师水平。CSDN 百天计划课程共分为 3 个阶段,4 个月完成。扫描下方二维码可领取千元优惠券。